近一年来,我听到了关于机器学习的两种截然不同的说法。表面上,它们从各自不同的层面刻画了这种技术,看似很矛盾,然而,倘若统筹来看,这些说法又指出了机器学习的本质,以及我们需要思考的机器学习的方式。
第一种说法的基本思想是机器学习将使机器变得智能并取代所有人类劳动力。这种说法在大众报刊上很常见,开发自动驾驶汽车的人也在如此鼓吹。据称,到了2020年,或者2022年,抑或2025年,机器智能将可以控制汽车,完全取代人类司机。这将使交通系统更安全、更有效。令很多人恐慌的是,这种机器智能所取代的工作,看上去会比人类做得更熟练。
这个说法的背后是人们对机器智能将颠覆经济、造成大多数人无法谋生的巨大恐惧。这暗示着,人类有血有肉的后代,将被硅和代码取代。对个别人,这种情况可以接受;对相当多的人,这种情况很可怕;对全世界的人,这种情况令人困惑。
最近,我在办公室一个同事那里听到了这种说法。这位同事是一位物理学博士,在技术与经济如何相互作用方面很有见地。但是,她对机器智能的社会影响深感忧虑。她喋喋不休地说:“你不觉得这次有所不同吗?每个人都说这不新鲜。但是,你不认为机器学习真的正在改变社会吗?”
我不赞同机器智能将取代人类的说法。我要指出一个事实,在过去的200年间,工程师们屡次宣称机器将取代人类,但事实一再证明他们是错误的。我也注意到,机器智能最起劲的支持者一般正在企图利用这项技术进行融资,因此他们竭力夸大自己所从事工作的影响。他们要想吸引大量投资,就必须论证他们拥有一项伟大的技术。
我的观点有一点不同:即使说机器智能不会取代人类,但是也要承认,机器智能很可能会破坏人类奋斗的三个主要领域:社会、经济和政治。它似乎也可能会破坏人类的其他两个领域:心理学和认识论——即我们思考自身和世界的方式,以及我们组织知识的方式。
关于机器智能的第二种说法大多来自研究生,但我也从企业主、IT主管以及一个14岁的瑞典学生那里听到过这种说法(这个瑞典学生偶然发现了我两年前在本刊发表过的一篇文章,因而联系上了我)。所有这些人所做的工作都会产生大量数据,他们每个人都希望把这些数据输入给机器学习算法,“看看有可能发现什么”。
这些人当中,没有人特别关注用这些算法来构建人类智能。他们并不认为自己是在用硅和代码组成的机器来取代有血有肉的人。对他们来讲,机器学习是一种数据分析的工具,一种用来发现文本、数字或图片中的模式的方法。就算他们认同这些算法正在取代人类,他们会说机器智能取代的是统计工作者,而不是普通的人。在许多方面,这种评价是正确的,它指出了机器学习最终将给社会带来的影响。
目前机器学习领域产生了两个研究流派,虽然当前的研究者可能只认同其中的一个。第一个流派专注人工神经网络,致力于人脑功能的建模。很长一段时期内,计算机科学家对神经元有兴趣。一篇1943年由沃尔特·皮茨(Walter Pitts)和沃伦·麦卡洛克(Warren MacCulloch)1撰写的论文《神经活动中内在思想的逻辑演算》(A logical calculus of the ideas immanent in nervous activity),影响了包括约翰·冯·诺伊曼(John von Neumann)在内的一批早期的计算机科学家。不过,到了20世纪70年代中期,人们发现人工神经网络的设想似乎不切实际。因为没有人能够提出设置神经网络参数的方法。
1974年,保罗·维博思(Paul Werbos)发明了一个设置神经网络参数的算法,称为反向传播(back propagation2)算法。这个算法表明,作为对数据分类的方法和根据数据进行学习的方法,神经网络很有效。但是,反向传播是一种计算量非常大的算法,因此在此后十年间并未引起多少关注。
不过,在20世纪70~80年代的大多数时间里,相比于神经网络,人工智能领域对逻辑和基于规则的系统更感兴趣。研究者为管理、培训和医疗诊断等应用构建了一些诸如此类的系统。
当时,对专家系统感兴趣的群体就有统计学社区。在1984~1994年之间,一个由统计学家和计算机科学家组成的团队尝试去构建一个基于规则的系统,希望它可以像专业统计学家一样学习和工作。
事实证明,构建基于规则的统计分析系统的任务,比大多数人预期的都困难。1990年以后,几乎没有团队继续从事这方面的研究。但是,这项工作已经建立了计算机科学和统计学之间的联系,并且展示了先进的统计建模技术的能力。这些技术很快成为在神经网络中设置参数的新算法的基础。到20世纪90年代中期,它们已经成为机器学习领域的新的核心内容。一位人工智能先驱曾评论道:“20世纪90年代最令人惊讶的是,统计算法在分类和识别数据方面取得了巨大成功。”
所以,如果说机器学习将取代人类劳动力,那么首当其冲被取代的就是像统计学家这样的劳动力。目前用机器学习来处理数据的企业主、研究生以及14岁的青少年,正在使用复杂的算法执行工作,而这些工作曾经是统计学家才能完成的。虽然这些人还不能彻底取代统计分析人员,但是他们已经能够在没有学习多元统计分析的细节知识或者在没有雇用专业统计学家服务的情况下完成大量工作。
机器学习远不是一种自动化技术。它要求用户对数据和分类有一定了解。但机器学习已经使得没有受过什么训练的人可以辨识新颖的现象、有趣的模式和认识世界的新方法。
我知道这篇文章并没有回答第一种说法所提出的问题。“机器学习将取代人类?”是一个留待解决的问题。我们最多只能说机器学习让更多人了解了数学分类的技术,改变了统计分析工作者这一群体的角色。我们也了解,机器学习使数据处理更严谨,并使得人类以机器学习处理数据的精度来观察世界。这样将使人类被淘汰吗?也许吧。机器学习确实改变了人类组织知识的方式,似乎也正在改变人类思考自身的方式。
脚注
1参见MacCulloch W S, Pitts W. A logical calculus of the ideas immanent in nervous activity[J]. Bull. Math. Biophysics, 1943(5):115–133。
2参见Werbos P. Beyond Regression: New Tools for Prediction and Analysis in the Behavioral Sciences[D]. Harvard University, 1974。
译者:吴茜媛 郑昕韬 西安交通大学
所有评论仅代表网友意见